这个Attention有三块功能构成:1.KV Compressor负责把N个token的KV压缩成1个,在DeepSeek V4系列模型里,N=4。2.Lightning Indexer再从压缩后的KV里挑选top-k个KV参与注意力计算,DeepSeek V4 Flash模型的k=512,Pro模型的k=1024。3.因为KV Compressor会把多个token压缩,压缩后的KV Entriy内部的token之间是无法相互看到的,而且语言模型对最近的token是高度依赖的。所以需要维护滑动窗口(Sliding Window),保留一些最近的未压缩KV,弥补压缩带来的损失。一般,sliding window=128。
最近 HuggingFace 上有个 DeepSeek V4 Flash 量化版 突然火了——更狠的是,作者是 antirez(Redis 作者 Salvatore Sanfilippo) 我查了一下 简介 事情其实是这样的:antirez 同步开源了两件配套的事: DeepSeek V4 Flash 的专用量化版 GGUF:托管在 huggingface.co/antirez/deepseek-v4 -gguf DwarfStar 4(简称 ds4):一个专门为 DeepSeek V4 Flash 设计的推理引擎,托管在 github.com/antirez/ds4 注意定语:ds4 不是通用 GGUF V4 Flash,这套组合是当前能找到的"最爽配置"之一 4. 通用性差是事实 不要指望它能跑 Qwen、Llama、其他 DeepSeek——它就只跑 V4 Flash,换模型就得换引擎 总结 ds4 + DeepSeek V4 Flash GGUF 这套组合,是
大家可能听说过很多次,DeepSeek V4就要爱了,这一次可能是最靠谱的时间点了。 就在上周,多位知情人士透露,DeepSeek创始人梁文锋在内部已经明确了节奏:下一代旗舰大模型V4,计划于4月下旬正式与公众见面 。 但这一次,DeepSeek V4干了一件牛逼的事情:完全运行在华为昇腾950PR芯片之上,底层代码从CUDA全面转向华为自研的CANN框架 。 这意味着什么? 但其实我觉得 DeepSeek V4 虽然会比 V3 更好,但一定没有大家像之前期待的那么炸裂。 我们应该用正常的眼光来看待更多“平凡、也会犯错的 DeepSeek",哪怕崩溃了,V4 不那么惊艳,也并不影响 DeepSeek 的历史地位,已经它仍然是一家巨牛逼的公司。
DeepSeek V4不只是聊天机器人,它是能真正干活的AI助手。 一、DeepSeek V4是什么? 2026年4月24日,DeepSeek发布V4预览版,两个版本: V4-Pro:完整版,Agent能力强,推理性能顶级 V4-Flash:轻量版,速度快,成本低 核心能力: 百万字上下文:一次能读1M 保存为result.xlsx" 效果: 一次生成可运行的代码 自动处理异常情况 代码质量接近中级工程师水平 真实案例: 某开发团队用DeepSeek V4写代码,从"半天一个功能"到"1小时一个功能", 4 代码能力: V4-Pro接近Claude 4 Sonnet 长文本处理: V4(1M)> Claude(200K) 成本: V4更低 中文优化: V4更好 ▪ 5.3 vs DeepSeek V3 需要更高级功能,升级到Pro版 一句话带走: DeepSeek V4不是聊天机器人,是你的AI工作伙伴。
DeepSeek V4:结构性的成本革命 DeepSeek V4的核心突破在于解决了超长上下文大模型在推理阶段的效率瓶颈。 三、开源护城河 vs 商业生态圈 DeepSeek V4:深植开源社区,构建开发者生态 完全开源:采用MIT协议,个人和企业均可免费下载权重并商用,显著降低了技术门槛。 如果希望完全掌控模型并实现私有化部署,DeepSeek V4是明确的选择。 但如果追求极致的性能上限和完备的官方工具链,GPT-5.5依然是难以绕过的标杆。 四、总结 回到最初的问题:GPT-5.5和DeepSeek V4,哪个更好? 数据高度敏感,要求完全合规 ✅ DeepSeek V4系列 完全开源,支持私有化部署且适配华为昇腾芯片,可控性高。
对于V4这样庞大的MoE模型,微调不仅是提升性能的手段,更是实现商业价值最大化的必经之路。第二章:微调前的准备工作成功的微调始于周密的准备。本章将指导你完成环境、硬件和数据的搭建。 自动检测load_in_4bit=True#使用4-bit量化#加载基础模型model,tokenizer=FastLanguageModel.from_pretrained(model_name="deepseek-ai /DeepSeek-V4-Flash",max_seq_length=max_seq_length,dtype=dtype,load_in_4bit=load_in_4bit,)4.3应用LoRA适配器展开代码语言 ,r=16,#LoRA秩target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"],#V4 在昇腾CANN软件栈上直接运行这些框架进行V4微调,仍面临兼容性挑战。可行路径:混合模式:在NVIDIAGPU上完成微调,导出FP16或INT4格式的模型,然后将微调后的模型部署到昇腾平台进行推理。
去年DeepSeek的产品线是分开的:V3干通用的活,R1专门搞推理。 DeepSeek从V3.1开始也走了这条路,V4当然也是混合架构。所以R2这个代号,大概率就这么退休了。就像OpenAI的o3,也成了最后一代独立推理模型,直接被吞进了GPT-5。 在很多人觉得“参数规模不太重要了”的今天,DeepSeek用V4说了一句:大就是有效,大就是聪明,大就是领先。但“大”也有代价。参数涨了,推理成本就压不住。 比架构更值得关注的:国产算力V4发布当天,华为云就宣布昇腾超节点完成全栈适配。这背后工程量有多大?DeepSeek需要把大量原本跑在NVIDIAGPU上的CUDA代码,迁移到华为的CANN架构上。 DeepSeek作为国内最强开源力量,正在用V4把国产算力生态拉进真正的实战场景。而且MIT许可证全开源,任何人都能拿去用、拿去改、拿去商用。写在最后V4这次发布,没有去年R1那种颠覆式的震撼。
中国AI实验室DeepSeek推出了其最新大语言模型DeepSeek V4的两个预览版本,这是对去年V3.2模型及伴随的R1推理模型的备受期待的更新,后者曾席卷AI领域。 该公司表示,DeepSeek V4 Flash和V4 Pro均为混合专家(Mixture-of-Experts)模型,每个模型拥有100万token的上下文窗口——足以让大型代码库或文档用于提示词中。 DeepSeek表示,由于架构改进,这两个模型比DeepSeek V3.2更高效、性能更佳,并且在推理基准上几乎“缩小了”与当前领先模型(无论是开放还是闭源)的差距。 在编程竞赛基准中,DeepSeek表示两款V4模型的性能“与GPT-5.4相当”。 V4 Flash和V4 Pro都仅支持文本,不像许多闭源同行那样支持理解并生成音频、视频和图像。值得注意的是,DeepSeek V4比当今任何前沿模型都便宜得多。
昨天我们介绍了Deepseek V4 Pro预览版正式上线!它的PLC编程能力到底如何? 那对于我们RealPLC而言,必须实时更新下,把这个模型都接入进来。 01 申请DeepSeek API 我们首先到DeepSeek开发者平台,获取到API KEY。这是最重要的一步。 Step1:登录DeepSeek官网。 在设置界面里: AI提供方选择DeepSeek,模型任选一个,DeepSeek的API密钥填写刚刚保存备用的KEY。BaseURL填写: 确定好保存更改即可。 然后我们可以用专家场景里面的PID应用来测试下DeepSeek V4 Pro生成西门子PLC程序效果: 我们进入服务器后台可以看到,Job ID已经生成了,说明DeepSeek成功响应: 再回到我们的web
DeepSeek 更新了V4? 下午5点左右,DeepSeek更新了一个新模型,据说是个小模型,整理能力我个人觉得比3.2是强一点的,但还比不上谷歌的Gemini 3,所以不确定是不是V4。 是不是很神奇,其实离DeepSeek R1发布才1年多,恍如隔世。
一、前言:超越“更大即更好”的新范式2026年4月24日,深度求索(DeepSeek)正式开源发布DeepSeek-V4系列预览版,一举引爆全球AI圈。 这种精细化的工程调优,使得V4能够在保持极高稀疏度的同时,依然获得稳定的训练效果和卓越的推理性能。 五、性能基准与实测对比DeepSeek官方及社区的多项基准测试表明,V4系列模型在多个维度上均达到了国际领先水平。 这些数据充分证明了V4“高效超大规模”理念的成功。它不仅在能力上不输于顶级闭源模型,在成本和效率上更是实现了降维打击。六、应用场景与开发者生态V4的发布,为开发者和企业打开了全新的应用可能性。 6.2开发者支持DeepSeek为V4提供了全面的开发者工具链:开源权重:在HuggingFace上免费提供,MIT协议允许商用。
DeepSeek V4版出来了,官方称目前是开源AI的最高分,堪比闭源的模型,优于Sonnet 4.5,虽然kimi 2.6也推出了,我还是切换到了DeepSeek Pro版本。 返回正题:如何用小龙虾配置DeepSeek V4 Pro。 1,充值 打开DeepSeek 开放平台(https://platform.deepseek.com/usage),充值走起。 ": "deepseek-v4-flash", "name": "DeepSeek V4 Flash"}, {"id": "deepseek-v4-pro", "name": "DeepSeek V4 Pro"} ] } 4,更新openclaw 新版本支持DeepSeek V4: # 升级到最新版(全局) npm i -g openclaw@latest # 检查版本,应该变成 2026.4 .x 或更新 openclaw -v 5,设置配置DeepSeek V4 Pro 关掉已有的openclaw: pkill -f openclaw pkill -f node 然后运行刚才设计apikey
DeepSeek V4 API 生产级接入:异步流式调用与高可用架构实战 摘要: 本文深入探讨 DeepSeek V4 API 在企业级应用中的生产级接入方案。 面对 DeepSeek V4 强大的千亿参数 MoE 架构,如何挖掘其性能潜力、保障服务稳定性并控制成本,是每个开发者必须面对的课题。 本文将带你从零构建一个生产级的 DeepSeek V4 代理网关,涵盖异步并发、流式输出、自动重试及实时监控四大核心模块。 DeepSeek V4 API 核心特性解析 DeepSeek V4 作为最新一代混合专家 (MoE) 模型,其 API 设计充分考虑了大规模应用场景的需求: 特性 说明 优势 128K 长上下文 支持超长文本输入与检索 实时 Token 计费监控 DeepSeek V4 采用按 Token 计费的商业模式。我们需要在每次调用后解析响应头,统计成本。
最后就是把Claude环境和模型配置下: 上图就是我们申请的DeepSeek API key。具体申请步骤参考: 把DeepSeek V4接入RealPLC,实现PLC自动编程! ="<your DeepSeek API Key>" $env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]" $env:ANTHROPIC_DEFAULT_OPUS_MODEL ="deepseek-v4-flash" $env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash" $env:CLAUDE_CODE_EFFORT_LEVEL /anthropic", "ANTHROPIC_AUTH_TOKEN":"<your DeepSeek API Key>", "ANTHROPIC_MODEL":"deepseek-v4 我们为了确认链接成功,可以问下它是谁,用的是哪家大模型,确定回复为deepseek-v4-pro。那么,这个时候你就可以愉快地使用这个CC和Deepseek V4 Pro开启AI编程对话之旅了。
V4进行构建。 DeepSeek V4也可通过NVIDIA NIM在Day 0下载,以便部署以构建长上下文编码、文档分析和代理工作流,使用熟悉的API模式。 驱动代理工作流DeepSeek V4特别适合代理,因为它在长上下文编排、推理和工具调用方面表现出色。 开发人员可以将DeepSeek V4配置为大语言模型:NVIDIA NemoClaw:在安全的OpenShell环境中运行OpenClaw,创建一个由DeepSeek V4驱动的长期运行的个人助手,用于代码生成 该蓝图基于LangChain Deep Agents,具有可扩展性,可以轻松将DeepSeek V4添加到工作流中进行编排和规划。
最近gpt-image-2生图、 deepseek v4模型比较火, 有同学想尝试一把。问我有没有推荐的途径 一些同学要么是因为没好用的魔法, 要么是觉得需要花钱。 这里推荐几种免费体验的途径。 2、 deepseek v4 deepseek v4 分为2个版本, deepseek v4 flash 和 deepseek v4 pro。 其实官网价格也还好,不算太贵。 https://zenmux.ai/invite/RU59J6 baseurl: https://zenmux.ai/api/v1 模型:deepseek-v4-pro-free 配置上自己的密钥。
撰文|张贺飞 编辑|沈菲菲 4月24日上午,姗姗来迟的DeepSeek V4终于显露真身。 翻看DeepSeek V4的技术文档,详细描述了模型的架构,其中一个重要升级是把大部分模块的优化器从AdamW换成了Muon,实现了更快的收敛速度、更优的训练稳定性。 DeepSeek在训练V4大模型时,同样采用了被验证过的Muon优化器。 需要说明的是,开源大模型的“协同进化”并未陷入同质化,正在走向一条“和而不同”的道路。 2025年8月发布的GPT-5,训练成本超过5亿美元;同期的Kimi K2 Thinking,训练成本约460万美元;DeepSeek没有公布V4系列模型的训练成本,但V3模型仅花费了557.6万美元. 让人欣慰的是,国产模型和国产算力的融合越来越紧密:DeepSeek V4的技术文档中,将昇腾NPU与英伟达GPU并列写入了硬件验证清单;月之暗面在最新的论文中将大模型推理的预填充和解码运行在了不同芯片上
新一代模型发布DeepSeekV4正式发布并开源,带来两个版本:模型参数规模定位DeepSeek-V4-Pro1.6T总参数/49B激活参数性能对标顶级闭源模型DeepSeek-V4-Flash284B 和deepseek-reasoner将于2026/07/24废弃。 兼容OpenAI和AnthropicAPI格式:参数值base_url(OpenAI)https://api.deepseek.combase_url(Anthropic)https://api.deepseek.com /json"\-H"Authorization:Bearer$DEEPSEEK_API_KEY"\-d'{"model":"deepseek-v4-pro","messages":[{"role":"system "),base_url="https://api.deepseek.com")response=client.chat.completions.create(model="deepseek-v4-flash
AI圈近期的热度,几乎全被DeepSeek V4的相关猜测承包了。 恰逢DeepSeek-R1发布一周年,官方GitHub代码库中突然曝光的“MODEL1”标识,瞬间点燃全网讨论热情。 今天我们梳理全网真实信息,聚焦大家最关心的四大核心焦点,看看各方都在热议什么~ 焦点一:发布时间——春节前后成共识,外媒与代码线索相互印证 ● 发布时间:关于DeepSeek V4的发布时间,全网猜测高度集中在 ● 业内普遍认为,V4若延续开源路线,将进一步强化这一优势。 春节的烟花要来了,DeepSeek V4 也要点燃中国 AI 的新引擎,不管是想让 AI 精准匹配品牌风格的创作者,还是需要适配行业术语的职场人,如果想通过微调让 V4 变成 “专属定制款”,可以看看 无论你是想微调行业咨询工具、报告生成器,又或是想解放双手的加班党、定制专属 AI 的科技迷,2 月中旬都可以蹲一波 DeepSeek V4 首发,再用 LLaMA-Factory Online 解锁定制新玩法
时间回到一年多前,DeepSeek-R1的横空出世,为狂奔的大模型创业赛踩了一脚刹车,进入决赛圈的大模型“六小虎”首当其冲。 和硅谷最大的区别,DeepSeek没有扮演吃掉池子里所有鱼的“鲨鱼”,而是像鲶鱼一样激活了整个中国大模型生态,大家纷纷拥抱开源。 有了DeepSeek贡献的“业界标准”,月之暗面在内的大模型团队不需要重复造轮子,快速降低了推理成本。故事并未止步于此。 DeepSeek在训练V4大模型时,同样采用了被验证过的Muon优化器。需要说明的是,开源大模型的“协同进化”并未陷入同质化,正在走向一条“和而不同”的道路。 2025年8月发布的GPT-5,训练成本超过5亿美元;同期的KimiK2Thinking,训练成本约460万美元;DeepSeek没有公布V4系列模型的训练成本,但V3模型仅花费了557.6万美元...